灰色综合评价法的思想和原理

在控制论中,人们常用颜色的深浅来形容信息的明确程度。用“黑”表示信息末知, 用“白”表示信息完全明确, 用“灰”表示部分信息明确、部分信息不明确。相应地,信息知的系统称为黑色系统, 信息完全明确的系统称为白色系统, 信息不完全确知的系统称为灰色系统。灰色系统是介于信息完全知道的白色系统和一无所知的黑色系统之间的中介系统。带有中介性的事物往往具有独特的性能, 更值得开发。

灰色系统是贫信息的系统,统计方法难以奏效。灰色系统理论能处理贫信息系统,适用于只有少量观测数据的项目。灰色系统理论是我国著名学者邓聚龙教投于 1982 年提出的。它的研究对象是“部分信息已知,部分信息末知”的“贫信息”不确定性系统,它通过对部分已知信息的生成、开发实现对现实世界的确切描述和认识。换句话说, 灰色系统理论主要是利用已知信息来确定系统的未知信息,使系统由“灰”变“白”。其最大的特点是 对样本量没有严格的要求,不要求服从任何分布。

社会、经济等系统具有明显的层次复杂性, 结构关系的模糊性, 动态变化的随机性, 指标数据的不完全性和不确定性。比如, 由于技术方法、人为因素等, 造成各种数据误差、短缺甚至虚假现象即灰色性。由于灰色系统的普遍存在,决定了灰色系统理论具有十分广阔的发展前景。随着灰色系统理论研究的不断深人和发展,其已经在许多领域取得不少应用成果。

考虑到我们要讨论的灰色综合评价问题,所以将主要讨论灰色关联度分析, 也就是探讨基于灰色关联度分析的综合评价方法。

社会系统、经济系统等抽象系统包含多种因素, 这些因素之间哪些是主要的, 哪些是次要的, 哪些影响大, 哪些影响小, 哪些需要发展, 哪些需要抑制, 这些都是因素分析的内容。比如,在粮食生产系统中,影响粮食产量的因素很多。比如肥料、农药、种子、气像、罕 力、土壤、水利、汫作、技术、政策等, 为了提高粮食产量, 为了达到少投人多产出, 为了达到经济效益、社会效益、生态效益的统一, 有必要作因素的关联分析。

回归分析虽然是一种较通用的方法,但大都只用于少因素的、线性的,对于多因素的、非线性的则难以处理。灰色系统理论提出了一种新的分析方法, 即系统的关联度分析方法。这是根据因素之间发展态势的相似或相异程度来衡量因素间关联程度的方法。

进行关联度分析, 首先要找准数据序列, 即用什么数据才能反映系统的行为特征。当有了系统行为的数据列 (即各时刻的数据) 后, 根据关联度计算公式便可算出关联程度。 关联度反映各评价对象对理想(标准)对象的接近次序,即评价对象的优先次序,其中灰色关联度最大的评价对象为最佳。

灰色关联分析, 不仅可以作为优势分析的基础, 而且也是进行科学决策的依据。

由于关联度分析方法是按发展趋势作分析, 因此对样本量的多少没有要求, 也不需要有典型的分布规律,计算量小, 即使是上十个变量(序列)的情况也可用手算, 且不至出现关联度的量化结果与定性分析不一致的情况。换句话说, 关联度分析方法的最大优点是它对数据量没有太高的要求, 即数据多与少都可以分析。它的数学方法是非统计方法,在系统数据资料较少和条件不满足统计要求的情况下,更具有实用性。

楖括地说, 由于人们对评判对象的某些因素不完全了解,致使评判根据不足;或者由于事物不断发展变化,人们的认识落后于实际,使评判对象已经成为“过去”; 或者由于人们受事物伪信息和反信息的干扰, 导致判断发生偏差等。所有这些情况归结为一点, 就是信息不完全, 即“灰”。灰色系统理论是从信息的非完备性出发研究和处理复杂系统的理论,它不是从系统内部特珠的规律出发去讨论,而是通过对系统某一层次的观测资料加数学处理,达到在更高层次上了解系统内部变化趋势、相互关系等机制。其中,灰色关联度分析是灰色系统理论应用的主要方面之一。基于灰色关联度的夷色综合评价法是利用各方案与最优方案之间关联度的大小对评价对象进行比较、排序。灰色综合评价法计算简单,通俗易懂。因此,现在也越来越多地被应用于社会、经济、䈍理的评价问题。

灰色综合评价法的模型和步骤

灰色理论应用最厂泛的是关联度分析方法。关联度分析是分析系统中各元素之间关联程度或相似程度的方法,其基本思想是依据关联度对系统排序。下面介绍基于关联度 分析的综合评价模型和步骤。

灰色关联度分析

在客观世界中,有许多因素之间的关系是灰色的, 分不清哪些因素之间关系密切, 哪些不密切, 这样就椎以找到主要矛盾和主要特征。关联度是表征两个事物的关联程度 具体地说,关联度是因素之间关联性大小的量度, 它定量地描述了因素之间相对变化的情况。

关联度分析是灰色系统分析、评价和决策的基础。灰色关联度分析是一种多因素统计分析方法, 用灰色关联度来描述因素间关系的强弱、大小和次序的。 从思路上看, 关联度分析是属于几何处理范畴的。它是一种相对性的排序分析, 基本思想是根据序列曲线几何形状的相似程度来判断其联系是否紧密, 曲线越接近, 相应序列之间的关联度就越大,反之就越少。

作为一个发展变化的系统, 关联度分析事实上是动态过程发展态势的量化分析。说得确切一点, 是发展态势的量化比较分析。发展态势的比较, 也就是历年来有关统计数据列几何关系的比较, 实质上是几种曲线间几何形状的分析比较, 即认为几何形状越接近, 则发展变化态势越接近, 关联程度越大。

假如考虑上表所示的三个数据列, 一个是某地区 1997-2003 年总收人 (亿元), 另一个是这个地区 1997–2003 年招商引资收入, 还有一个是该地区 1997–2003 年农业收 人, 将上述数列做成曲线。

从上图可以看出, 曲线 2 的形状与曲线 1 的形状较接近, 而曲线 3 与曲线 1 相差较大, 因此该地区对收人影响较大的是招商引资, 在制定该地区经济发展规划时, 显然应加大招商引安的力度。

这种因素分析的比较,实质上是几种曲线间几何形状的分析比较,而且对数据量也没有太高的要求, 即数据或多或少都可以分析。但事实上, 这种直观的几何形状的判断比较, 是比较粗糙的, 并且, 如果好几条曲线形状相差不大, 或者在某些区间形状比较接近, 就很难用直接观蔡的方法来判断各曲线间的关联程度。 下面就介绍最常用的衡量因素间关联程度大小的量化方法。

作关联分析先要制定参考的数据列 (母因素时间数列), 参考数据列常记为 $x_0$,一般表示为: $$ x_0=\left\{x_0(1), x_0(2), \cdots, x_0(n)\right\} $$ 关联分析中被比较数列 (子因素时间数列) 常记为 $x_i$, 一般表示为: $$ x_i=\left\{x_i(1), x_i(2), \cdots, x_i(n)\right\}, \quad i=1,2, \cdots, m $$ 对于一个参考数据列 $x_0$, 比较数列为 $x_i$, 可用下述关系表示各比较曲线与参考曲线 在各点的差:

$$ \xi_i(k)=\frac{\min _i \min _k\left|x_0(k)-x_i(k)\right|+\zeta \max _i \max _k\left|x_0(k)-x_i(k)\right|}{\left|x_0(k)-x_i(k)\right|+\zeta \max _i \max _k\left|x_0(k)-x_i(k)\right|} $$

式中, $\xi_1(k)$ 是第 $k$ 个时刻比较曲线 $x_i$ 与参考曲线 $x_0$ 的相对差值, 这种形式的相对差值称为 $x_i$ 对 $x_0$ 在 $k$ 时刻的关联系数。 $\xi$ 为分辨系数, $\xi \in[0,1]$,引人它是为了减少极值对计算的影响。在实际使用时, 应根据序列间的关联程度选择分辨系数,一般取 $\zeta \leqslant 0.5$ 最为恰当。

若记: $\Delta \min =\min \min \left|x_0(k)-x_i(k)\right|, \Delta \max =\max \max _t\left|x_0(k)-x_i(k)\right|$ 则 $\Delta \min$ 与 $\Delta \max$ 分别为各时刻 $x_0$ 与 $x_i$ 的最小绝对差值与最大绝对差值。从而有: $$ \xi_0(k)=\frac{\Delta \min +\zeta \Delta \max }{\left|x_0(k)-x_i(k)\right|+\zeta \Delta \max } $$

如果计算关联程度的数列量纲不同, 要转化为无量纲。无量纲化的方法, 常用的有初值化与均值化。初值化是指所有数据均用第一个数据除, 然后得到一个新的数列, 这个新的数列即是各不同时刻的值相对于第一个时刻的值的百分比。均值化处理就是用序列平均值除以所有数据, 即得到一个占平均值百分比的数列。另外, 还有我们经常使用的规范化处理方式.

关联系数只表示各时刻数据问的关联程度, 由于关联系数的数很多, 信息过于分散, 不便于比较, 为此有必要将各个时刻的关联系数集中为一个值, 求平均值便是作为这种信息集中处理的一种方法. 于是, 绝对关联度的一般表达式为; $r_i=\frac{1}{n} \sum_{k=1}^n \xi_i(k)$, 或者说 $r_i$ 是曲线 $x_i$ 对参考曲线 $x_0$ 的绝对关联度。

应该看到, 绝对值关联度是反映事物之间关联程度的一种指标, 它能批示具有一定样本长度的给定因素之间的关联情况。但它也有明显的缺点, 就是绝对值关联度受数据中 极大值和极小值的影响,一旦数据序列中出现某个极值, 关联度就会发生变化。因此, 绝对值关联度有时不能真正反映数据列之间的关联程度。另外计算绝对值关联度时, 需要对原数据作无量纲化处理, 比较烦琐, 而且, 分辨系数的取值不同, 也会导致关联系数的不唯一。

不过, 关联度分析的目的, 是在影响某参考数列 $x_0$ 的诸因素 $x_i$ 中找出主要因素, 也就是按对 $x_0$ 的关联程度大小对 $x_i$ 进行排序。

若 $x_i$ 与 $x_0, x_j$ 与 $x_0$ 的关联度分别为 $r_i, r_i$, 则:

于是, 我们就可以把影响母序列 $x_0$ 的因素 $x_i$ 按上述定义的优劣排序, 即按各自对 $x_0$ 的影响程度大小排序, 从而完成我们的关联分析。

总的来说, 灰色关联度分析是系统态势的量化比较分析, 其实质就是比较若干数列所 构成的曲线列与理想 (标准) 数列所构成的曲线几何形状的接近程度, 几何形状越接近, 其关联度越大。关联序则反咉各评价对象对理想 (标准) 对象的接近次序, 即评价对象的优劣次序, 其中灰色关联度最大的评价对象为最佳。因此, 利用灰色关联度可对评价对象的优劣进行分析比较。

基于灰色关联度分析的灰色综合评价法

对事物的综合评价, 多数情况是研究多对象的排序问题, 即在各个评价对象之间排出优选顺序。

灰色综合评判主要是依据以下模型: $\boldsymbol{R}=\boldsymbol{E} \times \boldsymbol{W}$ 式中: $\boldsymbol{R}=\left[r_1, r_2, \cdots, r_m\right]^{\mathrm{T}}$ 为 $m$ 个被评对象的综合评判结果向量; $W=\left[w_1, w_2, \cdots, w_n\right]^{\mathrm{T}}$ 为 $n$ 个评价指标的权重分配向量, 其中 $\sum_{j=1}^n w_j=1$ ; $\boldsymbol{E}$ 为各指标的评判矩阵:

$$ \boldsymbol{E}=\left[\begin{array}{cccc} \xi_1(1) & \xi_1(2) & \cdots & \xi_1(n) \\ \xi_2(1) & \xi_2(2) & \cdots & \xi_2(n) \\ \vdots & \vdots & \vdots & \vdots \\ \xi_m(1) & \xi_m(2) & \cdots & \xi_m(n) \end{array}\right] $$

$\xi_i(k)$ 为第 $i$ 种方案的第 $k$ 个指标与第 $k$ 个最优指标的关联系数。 根据 $R$ 的数值, 进行排序。

  1. 确定最优指标集 $\left(F^*\right)$ 设 $F^*=\left[j_i, j_2, \cdots, j_n^*\right]$ 式中 $j_k^*(k=1,2, \cdots, n)$ 为第 $k$ 个指标的最优值。此最优值可是诸方案中最优值(若某一指标取大值为好, 则取该指标在各个方案中的最大值; 若取小值为好, 则取各个方案 中的最小值), 也可以是评估者公认的最优值。不过在定最优值时, 既要考虑到先进性, 又要考虑到可行性。若最优指标选的过高, 则不现实, 不能实现, 评价的结果也就不可能正确。 选定最优指标集后, 可构造矩阵 $\boldsymbol{D}$ : $$ \boldsymbol{D}=\left[\begin{array}{cccc} j_1^* & j 3 & \cdots & j_n^* \\ j_1^1 & j_2^1 & \cdots & j_n^1 \\ \vdots & \vdots & \vdots & \vdots \\ j_1^m & j_2^* & \cdots & j_n^{\prime} \end{array}\right] $$ 式中: $j_k^{\prime}$ 为第 $i$ 个方案中第 $k$ 个指标的原始数值。

  2. 指标值的规范化处理 由于评判指标间通常是有不同的量纲和数量级, 故不能直接进行比较, 为了保证结果的可靠性, 因此需要对原始指标值进行规范处理。

设第 $k$ 个指标的变化区间为 $\left[j_{k_1}, j_{k 2}\right], j_{k 1}$ 为第 $k$ 个指标在所有方案中的最小值, $j_{k 2}$ 为 第 $k$ 个指标在所有方案中的最大值, 则可用下式将上式中原始数值变换成无量纲值 $C_i \in$ $(0,1)$ 。 $$ C_k^i=\frac{j_k-j_{k 1}}{j_{k 2}-j_k^k} \quad i=1,2, \cdots, m ; \quad k=1,2, \cdots, n $$ 这样 $D \rightarrow C$ 矩阵 $$ \mathbf{C}=\left[\begin{array}{cccc} C_1^* & C_2^* & \cdots & C_*^* \\ C_1^l & C_2^1 & \cdots & C_n^b \\ \vdots & \vdots & \vdots & \vdots \\ C_1^* & C_2^* & \cdots & C_{\varepsilon}^* \end{array}\right] $$

  1. 计算综合评判结果

根据灰色系统理论, 将 $\left\{C^*\right\}=\left[C_i^*, C_8^*, \cdots, C_n^*\right]$ 作为参考数列, 将 $\{C\}=\left[C_1^i, C_2^b, \cdots, C_n^i\right]$ 作为被比较数列, 则用关联分析法分别求得第 $i$ 个方案第 $k$ 个指标与第 $k$ 个最优指标的 关联系数 $\xi_i(k)$, 即: $$ \xi_i(k)=\frac{\min _i \min _k\left|C_k-C_k\right|+\rho \max _i \max _k\left|C_k-C_k\right|}{\left|C_k^*-C_k\right|+\rho \max _i \max _k\left|C_k^*-C_k\right|} $$ 式中, $\rho \in[0,1]$,一般取 $\rho=0.5$ 。 由 $\xi_i(k)$, 即得 $E$, 这样综合评判结果为: $R=E \cdot W$, 即 $$ r_i=\sum_{k=1}^n W(k) \cdot \xi_i(k) $$ 若关联度 $r_i$ 最大, 则说明 $\left\{C^i\right\}$ 与最优批标 $\left\{C^*\right\}$ 最接近, 亦即第 $i$ 个方案优于其他方案, 据此, 可以排出各方案的优劣次序。